Exploration de la donnée
L'environnement que l'on appelle Bac à Sable ou sandbox est dédié à l'exploration de la donnée. Pour cela il s'appuie sur plusieurs outils :
- L'exploration de données (dataviz) est réalisée avec l'outil Superset (et Trino) : Dataviz
- La mise au point d'algorithmes (datalab) est réalisée avec l'outil Jupyter : Datalab
Des espaces de stockage dédiés au Bac à Sable sont créés par l'Administrateur données. Ces espaces distincts de ceux de production, sont accessibles en lecture et écriture depuis le Bac à Sable.
Depuis l'environnement du Bac à Sable, il est également possible de lire des données de production. Depuis l'environnement du Bac à Sable, il est également possible de lire et écrire des données de l'EID.
Tous les espaces de stockage utilisés dans le Bac à Sable doivent être créés au préalable.
Le Bac à Sable est accessible aux utilisateurs métiers en fonction de leur rôle métier.
Alimentation des données
Le datascientist peut utiliser des EdS déjà existants et il peut également demander à l'Administrateur données la création d'espaces de stockage dédiés au Bac à Sable pour des besoins spécifiques.
Si le data scientist a besoin d'utiliser des données qui ne sont pas encore dans le socle, il utilise le composant Data Ingestion pour alimenter un espace auquel l'Administrateur données lui a donné accès.